Model Selection

Multi-turn Dialogue Scoring

# Multi-turn Dialogue Scoring

Beaver 7b V1.0 Reward

Preference model trained on PKU-SafeRLHF dataset for optimizing Beaver models in safe RLHF algorithms

Large Language Model

Safetensors English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase